基于TGIS与大数据技术的历史地名
综合信息系统构建研究

白江涛1,潘  2*,侯勇坚3,左永强1,杨慧慧1

1. 西安地图出版社有限公司,西安 7100542. 云南大学历史地理研究所,昆明 650091
3.
陕西师范大学西北历史环境与经济社会发展研究院,西安 710071

  科学存储地名的历史信息,实现地名的历史沿革的查询和可视化表达,可为历史地理等相关领域的研究提供时空一体化展示和时空分析工具。本文将时空框架和大数据技术引入历史地名数据库中,为历史地名信息系统的开发提供一种基于时空框架和时态地理信息系统(Temporal Geographic Information SystemTGIS的思路与方法;为历史地名信息的更新和维护提供大数据支撑;探索一种基于现代信息化技术的历史地名信息维护手段和传播方式。本研究建立了历史地名时空数据库,构建了历史地名综合信息系统,提供了针对历史地名的时空分析工具和基于大数据的历史地名更新机制,提供了解决地名相关研究成果相互借鉴和佐证的参考方案,提高了地名工作成果大众化服务的广度和深度,促进了相关研究成果的综合运用,揭示了不同需求下的历史地名信息的不对称性与互补性。

关键词TGIS;历史地名;时空框架;可视化;时空分析

DOI: https://doi.org/10.3974/geodp.2021.04.01

CSTR: https://cstr.escience.org.cn/CSTR:20146.14.2021.04.01

 

1  前言

地名在地理信息中属于基础地理信息要素,是信息查询的常用入口。但地名的时空变化过程并未得到很好的表达[1]。然而,随着社会的发展和变迁、大数据技术和人工智能技术的发展、互联网的普及,导致地名的快速动态更新与海量数据的网络传播,这给地名管理和服务工作带来极大的困难。地名信息的采集、更新、使用、维护和管理工作给广大地名工作者提出了新挑战[2]。大数据时代的到来使得地名逐渐在专业研究、信息查询和交互中成为重要的切入点[3,4]

地名拥有一般地理现象所具有的空间、属性、时间这3个基本特征[4]。然而,历史地名的存储和地名历史信息的表达方面,地名时态信息的不规范或者缺失十分严重[5]。掌握地理对象历史数据的变更情况不仅可以实现对现势性数据的分析,还可以回溯地理对象的历史以探寻规律,为预测未来提供可能[6–9]。据此,本项研究在“历史地名综合信息系统”建设过程中成功引入了TGISTemporal Geographic Information System)大数据技术,将基于大数据的语义分析与自动新技术和时空数据模型理论应用于地名数据库的建设,建立了历史地名时空数据库,构建了历史地名综合信息系统,提供了针对历史地名的时空分析工具和基于大数据的历史地名更新机制。

2  系统逻辑架构

本文研究构建历史地名时空数据库,能够为历史地名的更新与查询信息系统的建设提供一种基于大数据技术和TGIS模式与架构[10,11],以期给地名工作者和相关专业研究人员提供科学规范的基础资料和工具,能够更好地为社会服务。系统总体架构如图1所示。

 

 

1  历史地名时空数据库系统建设架构图

3  地名时空数据结构

地名是自然属性与人文属性地理学表达。要实现历史地名的更新就要对地名进行时空数据库构建并对地名的时空域进行分析。要实现地名的自动更新就要跨行业跨领域搜集相关数据,但是不同行业和不同领域的需求存在差异,对地名历史信息挖掘与描述也会存在差异,这些差异需要通过语义分析排除、缩减、相互佐证,最终确定或辅助确定地名历史信息的更新与维护。在时空中地名表达区域的变化往往是随机的,采用时空状态模型和格网模型,组织和管理地名时空数据是十分有效的[7]。为了方便对历史地名进行时空分析和可视化展示,本研究设计了基于GIS空间拓扑关系理论的地名时空数据库。数据库的总体概念设计如图2所示。

 

 

2  数据库总体设计

4  地名时空数据处理

二级区域格网的建立是模型实现的核心环节,它是利用现代信息化技术存储地名数据所有时空属性信息,利用现代地图表达方式实现地名数据的数字可视化。这种方法自带的算法不仅可以提高地名信息存储效率还可以提高信息查询效率和综合分析的便捷度。为了充分发挥算法的优势,本文的基本表达单元选用了传统的行政化单元,同一行政区块内相互连接的格网共同构成一个基本表达单元,系统只记录首尾两个格网单元的位置编码即可。(按照格网编码和记录顺序为先行后列、从左到右、从上到下;每个格网单元循环处理,并生成格网编码,编码由格网所在地名属性和格网位置组成;相互连接且地名属性相同的格网组成一个区块,若当前格网位置编码位于当前区块边界,则加入该区块,并更新区块边界,否则建立新区块,所在格网确定为新的区块边界。)

二级区域标引的核心是处理多边形矢量数据所表达的地名单元,处理后产生二级区域,给所产生的二级区域编码记录,并判断一级区域格网与二级区域格网的逻辑关系。(通过联合(Union)工具处理行政区划单元和区域图层生成二级区域,但要注意属性信息的维护;计算二级区域的格网坐标值,逐一识别、标识、存储、排序。通过循环计算为每一个二级区域编码;计算一级区域编码和二级区域编码的逻辑关系,记录逻辑关系编码,作为区域关系表的数据基础。)

5  地名变化时空分析、统计与处理

本文所述时空分析主要是指地名的空间定位、地名提取、地名时段合并、基于位置的地名频次统计、地名累积生存期计算和时空体积矩阵的生成等。

5.1  地名时空定位

通过大数据技术获取的新出现的历史地名,通过其空间属性确定其空间位置,结合时间属性和地名故事等信息确认其是否为新增地名,若是新增地名,就新增一条历史地名记录,若不是新增地名则判断为已有地名的沿革信息,将其存储为地名沿革信息。

5.2  地名提取

根据有关标准和规定,行政区划地名一般由专有名和通用名两部分构成,常见的数据库一般都采用完整的行政区划地名。本文的算法只提取专有名部分,记录为地名。

5.3  地名时段合并

常见的行政区地名的变更是通用名的变更,比如“郡”改成“府”,专有名的变更较为少见,需要执行合并的是专有名没有发生变更的。因此,提取专有名后,要首选将同一位置地名的不同时段合并,存储为地名沿革。(将编码相同的格网的时间属性和通用名按照时间顺序整体记录为时间字段,并排序;对格网记录逐一判断,若相邻格网满足“地名相同,时间相接”的关系,则记录合并,开始时间和结束时间以时间先后顺序确定,时间模糊的同步记录。若不满足,转至下一条记录,再进行判断。)

5.4  基于位置的地名频次统计

同一格网在历史上隶属的地名可能有很多,并且有些地名断断续续可能多次使用。(按照排序依次处理每一个格网,分别将每一个格网的所有记录存入时段表,并按照地名时段的开始时间排序;若当前地名未被统计,则该位置的地名记录增加一条,否则处理下一个地名时段,直至所有格网处理完毕。同时记录每个格网的位置边和和地名总数,生成格网位置与地名总数的矩阵,同原始格网数据进行空间连接,可以揭示目标区域地名变化与分布情况。)

5.5  地名生存期计算

地名生存期主要计算其分段与累积的情况,主要根据地名时空状态表统计每个地名的生存期数和累积生存期。地名的生存期、生存期分段与累积生存期是地名在时间维度上非常重要的3个指标,可以用来研究该地过去的文化发展规律和区域发展变化等。地名生存期是用地名时空状态开始时间和最终结束时间计算得到。而生存期分段和累积生存期的计算较为复杂(对地名时空状态表使用嵌套循环工具,依次处理每个地名及其时空状态;生存时间出现中断情况的分别记录始末时间,生存期数由中断次数决定,累积生存期是将相同位置相同地名所对应的时空状态时长累加生成的。)

5.6  地名时空体积矩阵生成

地名时空体积矩阵是地名时空分析的主要目标。本文所述的地名时空体积的计算考虑了地名在空间位置的分布堆积情况。本文计算思路如图3所示。(根据地名检索区域区块表和地名时空状态表,得到地名的时空状态序列及区域区块;计算该地名涉及空间范围的行列极值,并对行列极值进行嵌套循环处理,逐一检索将每个格网单元的时空状态,以时空状态序列为统计单元累加时空状态时长到该位置的累积生存期;循环结束,即可得到该地名的时空体积矩阵。)

 

 

3  地名时空体积矩阵生成流程图

 

6  地名数据时空变化的可视化

本文通过分析地名数据的特点,结合跨行业获取的大数据信息对地名实施语义分析,并结合地名沿革信息,确认地名属于新增、变更或注销,乃至消失的时空过程及空间状态。探讨这一动态过程的静态可视化表达方法,选择合适的形状、尺寸、色彩等视觉变量,分别设计了不同空间状态(点、线、面)地名的时空演变过程的可视化表达方法。

地名变更一般呈非连续的变化。静态的可视化方法能较好地表达地名的时空演变过程。本文按照地名的空间状态将地名分为点状、线状、面状三大类。据此,对不同的地名需要选择合适形状变量、颜色变量或尺寸变量的地图可视化符号表达。用相似和对比设计原则区别地名变更前后的相同性和差异性,以此表达地名的动态发展过程。

6.1  点状地名时空变化可视化

地名的变更包括空间位置和属性信息的变化。点状地名的空间位置变化有新增、消失或迁移,新增和消失用简单的地图符号即可表达清楚,对于迁移变化,本文选用了运动线法表示,也可以同时表达迁移前后的位置,用不同颜色体现视觉层次,以此表达地名的迁移。点状地名属性变更的可视化相对较简单,等级变化一般只需要改变符号的大小样式等或者注记样式就能表达清楚;更复杂的变化也可以在符号变更的基础上,对符号进行扩展加强可视化效果,表达地名属性的变化。如图4所示:

 

 

4  点状地名时空变化可视化示例

 

6.2  线状地名时空变化可视化

线状地名空间位置变更的可视化,本文根据变更后的现状用线型或颜色表达现状地名的空间变化。如图5所示,道路空间位置的变更主要包括延长旧路和旧路改线。

 

 

5  现状地名空间变化可视化示例

 

线状地名属性信息变更的可视化表达方法比较灵活,通过线型、颜色、线宽注记等方式表达,也可几种方式综合表达。如图6所示。

 

 

6  现状地名属性变化可视化示例

 

6.3  面状地名时空变化可视化

面状地名的变化包括形状、面积和地名属性的变化。其变化可通过颜色、形状、显示层次等可视化方法表达。本文以行政区划变更为例,一个县级行政区应该被街道、乡镇和社区铺满其空间区域,而且没有空隙和重叠,同级行政区划地名的空间拓扑关系应当是相邻、相接或相离的。

面状地名的空间位置变更往往非单向变化,一个面地名扩张图收缩往往伴随的行政或者级别的变更,其属性也会随之发生变化。面状地名空间位置变更的可视化方法较线状地名复杂,但可视化效果差异较大,这个差异往往与比例尺和区块大小紧密相关。不同地名区划用不同色块表达,根据地名使用时间的先后顺序确定其显示层次,时间越晚显示层次越高。该方法能较为直观地看出面状地名的空间变更某一时刻的状态及其变更过程。如图7所示。

 

 

7  面状地名空间位置变化可视化示例

 

对于面状地名属性信息变更的可视化,可利用其在地图上的图幅空间,通过添加或变更注记、添加符号等方式表达。例如对某行政区域的农业、工业、服务业生产总值变更情况的可视化效果如图8所示。

 

 

8  面状地名属性信息变化的可视化示例

 

面状符号的形状和编辑等同时发生变更的复杂变化,通常也需要用颜色、层级和其他方式结合的复杂方法表达。本文使用图层透明度控制来调整显示层级的辅助可视化方法展示,即当多时间片刻的图形发生重叠时,可根据用户的意愿,通过让某些图层显示或隐藏的方法调整图层显示层次,减弱或消除图层之间的互相干扰,将目标信息准确表达。这种对透明度的调整,可有效解决多图层叠合的信息表达。更复杂的变化也可借助信息图表辅助表达。如图9所示。

 

 

9  面状地名综合变化的可视化示例

7  历史地名时空变化综合信息系统功能与管理

7.1  历史地名时空变化综合信息系统主要功能

数据库基础数据覆盖全国(可扩展至全球),历史文化专题数据覆盖陕西省全域。目前数据库的历史地图数据主要由基于《中国历史地图集》[13]全国历史地图数据和陕西省秦朝至今的历代历史地图数据组成。已经建设完成的历史地名专题信息主要有:陕西省古今地名对照数据近9,000条,陕西省重点文物保护点65,000多个,陕西省境内的遗址遗迹地名信息1,000多条,传统建筑地名信息近200条,古代陵墓地名信息100多条,宗教文化地名信息30多条,诗词教育相关地名信息近10,000条。而且所有地名相关信息均是动态更新机制,更新频率将受地名管理部门的审批和平台入驻专家的成果发布时间的影响,后台会根据各机构反馈的研究成果动态更新。

大数据技术应用于历史地名时空变化数据库的建设,在该研究中解决的主要问题是以现代地名为匹配节点,分析不同专业和领域对该现代地名所对应的古地名的专业性成果,利用数据技术综合分析找出地名对应的历史沿革和地名故事信息,结果存入历史地名数据库。如图10所示。

 

 

10  大数据技术在历史地名更新中的应用逻辑

历史地名时空变化数据库主要集成了中国历史文化名城的历史地图数据,古旧地图数据,历史影像资料和中国的部分历史地名时空数据;建立了数据录入和分析技术规范;集成了云模型数据库;提供了在线制图与可视化展示;搭建了相关领域的成果展示与交流平台;为相关领域提供了数据管理平台;开发了历史地理及其相关领域的基于GIS的可持续性的数据挖掘与生产机制。基于历史地名时空变化数据库构建的历史地名时空变化综合信息系统具有对地名的采集、管理、更新、分析、可视化展示、下载共享等功能;可以满足各领域对可信赖的历史地名信息的查询与利用。部分功能展示如图11所示:

 

数字地图-3    数字地图-5(可视区域分析)

                 a 历史地名资源库                                       b 可视域分析

数字地图-4(诗词热度分析)    数字地图-6(剖面分析)

                     c 热度分析                                          d 剖面分析

 

11  历史地名时空变化综合信息系统部分功能展示图

 

7.2  历史地名时空变化综合信息系统的管理

该项目由财政部“2016年中央文化企业国有资本经营预算支出项目”(2230201国有经济结构调整支出)资助,是教育部人文社会科学重点研究基地重大项目“中国西北地区发展的历史经验研究”(17JJD770012)的阶段性研究成果。项目建设和运维由西安地图出版社牵头和负责,目前主要参与单位陕西师范大学西北历史环境与经济社会发展研究院、西安外国语大学、宝鸡文理学院、首都师范大学、西安建筑科技大学中国城乡建设与文化传承研究院、西安市民政局、西安市地名协会、陕西省图书馆。后期根据内容建设及相关工作需要会增加建设单位。数据库暂时没有在公网开放,对国内专业研究机构免费开放,但使用者需要遵守地图有关使用规范,遵守数据库授权协议的约定,同意其研究成果对西安地图出版社免费共享。

8  讨论与总结

基于大数据技术和TGIS理论的历史地名更新与挖掘体系,可以最大限度地发挥地名及其附属资源的效能;可以为相关研究人员提供规范的基础资料和挖掘工具;可以将挖掘的相关成果转化成大众读物,通过线上和线下的方式向社会传播地名相关的文化和知识。

基于TGIS与大数据技术的历史地名综合信息系统主要是集地名数据建设、地名数据库智能维护、地名数据动态过程的静态可视化表达、地名数据的查询与辅助分析,以及地名数据或相关成果的展示与可视化于一体的综合系统。主要针对历史地名关于时间维度的查询与展示等问题,提出了基于大数据技术的历史地名智能更新理论;建立了基于地名的时空框架模型与数据库设计开发。

下一步,数据库建设主要工作有:扩大历史地名及其相关数据的空间覆盖范围;开发基于古地图和古文献研究成果的古地名时空智能匹配和地名信息标引功能;开发基于地名故事、文化地名等内容的面向大众的服务端;逐步完善和地名研究部门或地名管理部门的数据对接。

 

作者分工:白江涛、潘威对历史地名综合信息系统的开发做了总体设计;左勇强、杨慧慧等采集和处理了数据库相关数据;白江涛设计了模型和算法;左勇强做了数据验证;白江涛撰写了论文等。

 

利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。

参考文献

[1]      黄大宁. 基于TGIS的县级地名时空数据查询系统构建[D]. 福州: 福州大学, 2014.

[2]      王东鹏. 贵阳市数字地名公共服务平台设计与实现[D]. 成都: 电子科技大学, 2010.

[3]      任东风, 徐爱功, 朱艳娟. 阜新市地名查询系统的建立[J]. 地理空间信息, 2011, 9(6): 107-110, 1.

[4]      刘璐, 卢金莎. 基于GIS的地名信息触摸查询系统设计与实现[J]. 测绘与空间地理信息, 2012, 35(10): 110‒112.

[5]      张保钢, 王润生, 高莉. 点状地名的时空数据模型[J]. 国土资源遥感, 2005(4): 82‒85.

[6]      周云轩, 付哲, 刘殿伟等. 吉林省西部土壤沙化、盐碱化和草原退化演变的时空过程研究[J]. 吉林大学学报(地球科学版), 2003(3): 348‒354.

[7]      傅学庆. 历史地名时空状态数据模型研究[D]. 石家庄: 河北师范大学, 2019.

[8]      Smith, B. Engaging geography at every street corner: using place-names as critical heuristic in social studies [J]. The Social Studies, 2018, 109(2): 112‒124.

[9]      Choi, S. H., Wong, C. U. I. Toponymy, place name conversion and wayfinding: South Korean independent tourists in Macau [J]. Tourism Management Perspectives, 2018, 25: 13‒22.

[10]   赵帅华. 基于3S技术的地名信息一体化设计与实现[D]. 武汉: 武汉大学, 2017.

[11]   Yao, X., Zhu, D., Ye, S., et al. A field survey system for land consolidation based on 3S and speech recognition technology [J]. Computers and Electronics in Agriculture, 2016, 127: 659‒668.

[12]   艾嘉豪. 地名地址匹配算法研究[D]. 昆明: 昆明理工大学, 2019

[13]   谭其骧. 中国历史地图集[M]. 北京: 中国地图出版社, 1982.